Chapitre 1 Statistique descriptive

L’activité statistique comprend deux aspects complémentaires : la statistique descriptive, partie indis­pensable de tout projet d’analyse de données; et l’inférence statistique, qui suit souvent — mais pas toujours — l’analyse descriptive. Un sondage, une enquête, une recherche scientifique produisent de nombreuses données qu’on ne peut déchiffrer tant qu’on ne les a pas réduites à des dimensions compréhensibles. Les techniques qui permettent de réduire la dimension de ces données — les tableaux, les graphiques, ainsi que les « mesures statistiques » telles les moyennes et les ratios —   font partie de la statistique descriptive.


Ces techniques ne décrivent que les données observées. Quand celles-ci portent sur une population—la totalité des objets d’intérêt—les méthodes descriptives suffisent. Mais la plupart des études sociales ou expériences scientifiques se limitent à un échantillon, une partie de la population. Les données qui en résultent seront quand même soumises à une analyse descriptive : qu’il s’agisse d’un échantillon ou d’une population, il faut que les données soient résumées. Mais l’étude ne peut s’arrêter là, car son objet, c’est la population, pas l’échantillon. L’échantillon n’est qu’une image de la population, une image qu’on souhaite fidèle, mais qui n’est jamais parfaite. Il révèle — à peu près — certaines des caractéristiques de la population, mais il peut aussi « révéler » des choses qui ne sont pas vraies. Dans quelle mesure peut-on faire confiance aux observations aux données d’un échantillon et déduire qu’elles sont également vraies (ou à peu près) de la population ? C’est à ces questions que doivent répondre les techniques d’inférence statistique.